Présentation
Cette journée thématique “Humanités Numériques et IA” est organisée avec le soutien de l’AFIA et de l’action des Sources aux Données Historiques en Humanités Numériques du GdR MADICS dans le cadre de la Plate-Forme Intelligence Artificielle (PFIA) qui aura lieu du 30 juin au 4 juillet 2024 à Dijon. La journée se tiendra le vendredi 4 juillet 2025.
Le vocable humanités numériques s’est aujourd’hui imposé pour désigner les travaux de recherche relevant tantôt : de la création, la gestion et la mise en œuvre de jeux de données numériques dans les domaines des sciences humaines et sociales ; de la modélisation et la formalisation de processus sociaux à l’aide d’outils mathématiques et informatiques ; ou de l’analyse des usages et des communautés numériques du point de vue des sciences humaines et sociales [1]. La journée “Humanités Numériques et IA” a pour but de faire un point sur les usages de l’intelligence artificielle dans le domaine des humanités numériques. Elle fait suite à une première journée organisée en 2024 sous l’égide de l’AFIA et des GdR MADICS et MAGIS, qui s’est concentrée sur les défis posés par les humanités numériques aux approches développées en intelligence artificielle.
Pour cette deuxième édition, nous recherchons des contributions portant sur le lien entre les sources de connaissances mobilisées par les chercheurs en sciences humaines et sociales et les données produites, manuellement ou automatiquement, à partir de ces sources pour servir de support à leurs analyses. Il peut s’agir de sources numériques ou non, de différentes natures : documents d’archives textuels ou iconographiques, formulaires d’enquêtes, relevés de capteurs, données du Web (réseaux sociaux, données participatives, etc.), données structurées de la recherche, etc. Leur traitement pour produire des données exploitables et diffusables peut présenter diverses difficultés: données non structurées, sous contraintes de droits d’auteur, nominatives, langues anciennes, rares, peu dotées, etc. Leur résolution impose des choix de transcription, de structuration, d’annotation, d’anonymisation, etc. qu’il convient de documenter afin de permettre aux futurs utilisateurs des données produites de prendre en compte les limites d’utilisation inhérentes aux choix effectués et aux traitement appliqués aux sources.
Nous sommes donc particulièrement intéressés par les propositions qui mettront en avant des approches relevant de l’intelligence artificielle et prenant en compte les questions suivantes:
- Découverte et accès aux sources: identifiants, métadonnées, approches de recherche d’informations, standards de diffusion, infrastructures de stockage et de diffusion, etc.
- Approches pour la reconnaissance et l’extraction d’informations dans des sources non structurées: quelle traçabilité pour les informations extraites?
- Annotation sémantique de sources: quels référentiels pour les sciences humaines et sociales (thésaurus, ontologies, graphes de connaissances, etc.)?
- Représentation et exploitation des informations de provenance entre données et sources.
- Utilisabilité des données produites: comment évaluer la réutilisation des données de la recherche? Qu’est-ce qui favorise la réutilisation d’un jeu de données, au-delà des principes FAIR [2]?
La journée s’adresse aussi bien aux jeunes chercheurs qu’aux chercheurs plus expérimentés ainsi qu’aux industriels, à la fois dans les domaines des sciences humaines et sociales, des humanités numériques et de l’intelligence artificielle. Elle est ouverte à la présentation de travaux à différents stades d’avancement.
Dates importantes
- Soumission des articles :
11 avril 2025 25 avril 2025
- Notification aux auteurs :
9 mai 2025 19 mai 2025
- Réception des versions définitives :
16 mai 2025 31 mai 2025
- Date de la journée : 4 juillet 2025
Programme
9h00-10h00: Conférence invitée IC
En ouverture de la journée thématique Humanités Numériques et IA, nous vous proposons d'assister à la présentation invitée de la conférence d'Ingénierie des Connaissances, qui sera donnée par Marieke van Erp (KNAW Humanities Cluster): Layering Knowledge to Unpack the Layers of Meaning in Historical Texts.
10h30-12h00: Session IC-HNIA – Ingénierie des connaissances pour les humanités numériques
Session 1
10h30 |
|
|
PeGazUs : une méthode de reconstitution de l’évolution des entités géographiques à partir de données hétérogènes et fragmentaires. Charly Bernard, Nathalie Abadie, Bertrand Duménieu et Julien Perret. |
11h00 |
|
|
Développement d’une ontologie pour l'analyse de textes de décisions administratives d’Ancien Régime par des Grands Modèles de Langage. Gilles Falquet, Christophe Chazalon, Marco Sorbi, Stéphane Marchand-Maillet et Laurent Moccozet. |
11h20 |
|
|
Extraction et interprétation sémantique de tables anciennes : défis et perspectives.. Solenn Tual, Nathalie Abadie, Joseph Chazalon, Bertrand Duménieu et Julien Perret. |
14h00-16h00: Session HNIA - APIA – Des sources aux données: enjeux de traçabilité des données pour les humanités numériques
Session 2
14h00 |
|
|
Repenser les collections patrimoniales par le prisme de l'IA. Marion Charpier et Emmanuelle Bermès. |
14h20 |
|
|
Amélioration de la segmentation de scènes par l’exploitation de relations spatiales : application aux sceaux byzantins. Ege Şendoğan, Victoria Eyharabide et Isabelle Bloch. |
14h40 |
|
|
Harold: un système de requête itératif et interactif pour l'exploration de corpus de patrimoine culturel. Prunelle Daudré-Treuil, Olivier Bruneau, Jean Lieber, Emmanuel Nauer et Laurent Rollet. |
15h00 |
|
|
Quand les humanités numériques rencontrent l’IA : une enquête sur la propriété à Paris. Aaron Parmentelat. |
15h20 |
|
|
Evaluation automatique du retour à la source dans un contexte historique long et bruité : les débats parlementaires de la Troisième République française. Aurélien Pellet, Julien Perez et Marie Puren. |
15h40 |
|
|
Synthèse des présentations autour des enjeux de traçabilité des données pour les Humanités numériques. Nathalie Hernandez, Nathalie Abadie, Bertrand Duménieu et Sébastien Poublanc. |
NB : Les lignes en jaune correspondent à des articles acceptés à la conférence IC 2025 et celle en vert à un article accepté à la conférence APIA 2025.
Soumissions
Dans la mesure où la langue officielle de la conférence est le français, les articles devront prioritairement être soumis en français. Les soumissions d’articles en anglais sont toutefois possibles, mais il faudra traduire le texte en français pour la version finale, en cas d’acceptation.
Thèmes de la journée
Les soumissions devront porter sur un ou plusieurs des thèmes ci-dessous, en mettant l’accent sur le lien entre sources et données. La liste proposée n'est toutefois pas exhaustive.
- Recherche d’informations, indexation, recommandation à partir de grands corpus de documents.
- Préparation de documents anciens numérisés : normalisation, redressement automatique de pages, géoréférencement de cartes, etc.
- Analyse de documents anciens (textuels ou iconographiques) : traitement automatique de documents numérisés, qualité des documents numérisés, analyse de mises en page, reconnaissance de texte et de symboles, reconnaissance d’écriture manuelle, vectorisation automatique de cartes, etc.
- Acquisition de connaissances à partir de textes, à partir d’images (photographies, estampes, cartes, etc.), de données non structurées, etc.
- Représentation des connaissances et raisonnement, ontologies pour les humanités numériques.
- Extraction et acquisition de connaissances, peuplement d’ontologies, annotation sémantique de documents anciens.
- Provenance et confiance dans les données, incertitude, incomplétude, croisement de sources, métriques et évaluation de la qualité des données et des connaissances.
- Analyse de liens, communautés en ligne, réseaux sociaux, médias sociaux.
- Fouille de données d’opinions, de dépêches, de microblogging, géoréférencement de textes.
- Autres mises en œuvre de l’IA pour l’extraction, la structuration ou l’analyse de données spatiales, temporelles, incertaines, incomplètes pour des applications en Humanités Numériques…
Format des soumissions
Nous acceptons un format unique d’articles comportant 4 à 6 pages. Chaque soumission fera l’objet d’une évaluation par plusieurs membres du comité de programme. Les articles sélectionnés donneront lieu à des présentations orales (en français sauf impossibilité majeure).
Les actes de la journée seront regroupés dans un document pdf publié en ligne.
Modèle de documents
Les articles doivent respecter le style PFIA 2025 et être soumis au format PDF via EasyChair.
Comité de programme
Co-président.e.s du comité de programme
- Nathalie Hernandez (IRIT, Université Toulouse Jean Jaurès, UT2J)
- Nathalie Abadie (LASTIG, Université Gustave Eiffel, IGN-ENSG)
- Bertrand Duménieu (CRH, École des Hautes Études en Sciences Sociales)
- Sébastien Poublanc (FRAMESPA, Université Toulouse Jean Jaurès, UT2J)
Comité de programme
- Ségolène Albouy (Laboratoire Imagine - École des Ponts ParisTech)
- Mickaël Coustaty (Laboratoire L3i - La Rochelle Université)
- Mathieu D'Aquin (LORIA, University of Lorraine, France)
- Cédric Du Mouza (Conservatoire National des Arts et Métiers)
- Carlos-Emiliano González-Gallardo (University of Tours)
- Julie Gravier (ThéMA)
- Gaël Lejeune (Paris Sorbonne University)
- Katherine McDonough ( The Alan Turing Institute)
- Valérie Schafer (C2DH, University of Luxembourg)
- Arnaud Soulet (University of Tours)
Contact
Pour tout problème ou question en lien avec les soumissions et les relectures merci de contacter les président.e.s du comité de programme par le biais de la plateforme easychair : hnia2025@easychair.org
[1] Camille Roth. Digital, digitized, and numerical humanities. Digital Scholarship in the Humanities, 2019, 34 (3), pp.616-632.
[2] Principes FAIR